export const metadata = { sidebar_position: 3, title: "🟢 Створення музики" };

# 🟢 Створення музики

Моделі для створення музики стають дедалі популярнішими та з часом матимуть великий вплив на музичну індустрію.

Ці моделі можуть створювати послідовності акордів, мелодії або ж навіть цілі пісні. Крім того, вони моделюють та створюють музику в певних жанрах, а також складають або імпровізують в стилі певних виконавців.

Однак, незважаючи на неймовірний потенціал музичних моделей, написання запитів для них все ще є не легкою справою. На відміну від моделей для генерації зображень або тексту, модель для створення музики часто не можна повністю налаштувати так за допомогою запитів, щоб отримати гарний кінцевий результат.

## Нейронна мережа для створення музики Riffusion

<div style={{ textAlign: "center" }}>
  <Image
    src="/docs/assets/miscl/riffusion_phonk.webp"
    width={1052}
    height={694}
    style={{ width: "500px", margin: "auto" }}
  />
</div>

Riffusion(@Forsgren_Martiros_2022) – це вдосконалена версія Stable Diffusion, якою можна керувати за допомогою запитів для створення інструментів і псевдостилів, однак вона має обмежену кількість доступних бітів.

## Mubert

[Mubert](https://mubert.com/), очевидно, інтерпретує запити використовуючи аналіз тональності, який пов’язує відповідну музичну стилістику з запитом (повноцінний контроль музичних параметрів через запити неможливий). Поки що не зрозуміло, яку частку роботи під час створення музики виконує ШІ.

## Інше

Існують спроби використати GPT-3 як інструмент для перетворення тексту в музику із фактичним написанням запиту для музичних елементів на «мікрорівні» нот (замість розпливчастих запитів для аналогій стилю, mubert та riffusion продукують) (наприклад, `write the notes for a folk song that only uses A, B, C#, F#, and G`). Однак наразі ця ідея є дещо обмеженою, оскільки можна використовувати тільки деякі інструменти.

Інші підходи передбачають створення ланцюжка моделі, що [перетворює будь-яке зображення на звук, який його представляє](https://huggingface.co/spaces/fffiloni/img-to-music) і далі, завдяки запиту до ChatGPT, генерується код для [бібліотек Python, які вже створюють звук](https://twitter.com/teropa/status/1598713756074246145).

## Примітки

Запити для створення музики все ще потребують допрацювання. MusicLM має багато перспектив, але він ще не доступний для громадськості.
